SPSS 数据准备 1 – 概述主要步骤

作者:Ruben Geert van den Berg,发布于 数据准备 专栏

当我们开始分析数据文件时,首先要检查数据是否存在一些常见问题。例如,我们要确保变量具有正确的格式,不包含任何奇怪的值,并具有合理的分布。下表建议了应该采取的步骤以及顺序。

为了充分利用这些教程,我们鼓励您下载并打开 hotel_evaluation.sav 文件,跟着教程一起操作。

SPSS 数据准备 - 练习文件

SPSS 数据准备 - 概述主要步骤

序号 检查内容 如何检查? 如何修复?
1 案例数和变量数 检查 数据视图 (Data View) (不适用)
2 唯一案例标识符 (Unique Case Identifier) 使用 AGGREGATE 命令 创建唯一 ID 变量
3 不良变量类型 (Undesirable Variable Types) 检查 变量视图 (Variable View)数据视图 (Data View) 转换变量
4 用户缺失值 (User Missing Values) 的存在 每个变量的频数表或直方图 指定 用户缺失值 (User Missing Values)
5 具有大量缺失值的变量 (Variables with many missing values) 每个变量的条形图或直方图 删除变量或从分析中排除
6 不方便的分布 (Inconvenient distributions) 每个变量的条形图或直方图 删除变量或从分析中排除
7 小类别 (Small categories) 每个变量的条形图 合并类别
8 不良编码 (Undesirable coding) 每个变量的条形图 反向编码变量
9 具有大量缺失值的案例 (Cases having many missings) 计算每个案例的缺失值数量 从分析中排除案例

SPSS 数据准备 - 工作流程

那么,我们如何在实践中执行这些检查呢?我们建议您首先执行步骤 1-3,因为它们涉及整个数据文件。

接下来,我们单独检查数据中的每个变量 - 从上到下。如果变量是分类变量,我们创建一个带有条形图的频数表。如果变量是计量变量,我们运行一个直方图。基于此输出,我们执行步骤 4-8

这些步骤的所有输出都是使用简单的 FREQUENCIES 命令创建的,该命令可以一次处理多个变量。您可以考虑为(类似编码的)变量组运行这些命令,而不是单独处理变量。

在检查 - 并可能纠正 - 每个变量之后,我们完成步骤 9